花費 6 ms
煉丹寶典 | 整理 Deep Learning 調參 tricks

記錄煉丹優化tricks 最后更新: 2020-04-15 18:17:57 尋找合適的學習率(learning rate) 學習率是一個非常非常重要的超參數,這個 ...

Fri Apr 10 00:50:00 CST 2020 0 5445
論文閱讀 | Adversarial Training for Large Neural Language Models

本文把對抗訓練用到了預訓練和微調兩個階段,對抗訓練的方法是針對embedding space,通過最大化對抗損失、最小化模型損失的方式進行對抗,在下游任務上取得了一致的效果提升。有趣的是, ...

Thu Oct 15 01:01:00 CST 2020 2 780

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM